【直播】我的基因组 36:这些可能是somatic突变的位点究竟是什么?
吓死我了!
前面我们讲到了可以把突变文件注释到dbsnp数据库,而dbsnp数据库信息非常丰富,比如我们可以看
##INFO=<ID=SAO,Number=1,Type=Integer,Description="Variant Allele Origin: 0 - unspecified, 1 - Germline, 2 - Somatic, 3 - Both">
这个SAO 信息很重要,请自行搜索了解变异为什么区分成germline和somatic。下面我用脚本统计一下SAO的信息:
cat realign.dbsnp.vcf |perl -alne '{/(SAO=\d)/;print $1}' |sort |uniq -c
我有近76万的位点没有在dbsnp数据库里面,剩余的在dbsnp里面的,有1610个可以肯定是germline的mutation,还有142个是可能是somaticmutation,这些位点很可怕,somatic mutation意思是在人体成长过程中的后发突变,很大可能是癌症或者疾病相关突变!
我写脚本看了看这142个可能是somatic突变的位点所在的基因:
cat realign.dbsnp.vcf |perl -alne '{print if /SAO=3/;}' >dbsnp_both_germ_somatic.vcf
cat dbsnp_both_germ_somatic.vcf |grep GENEINFO |perl -alne '{/(GENEINFO=.*?);/;print $1}' |sort -u
MUC开头的我大概知道是什么意思,因为我有中耳炎,它突变我不觉得稀奇!
BRCA1,2都突变了,我觉得可能是科研界过度研究,这个我暂时也不害怕!
CD分子的突变,预示着免疫机理可能是有点麻烦,但毕竟只是可能!
其余的基因,我都不认识, 因为我知识水平有限!
当然,我只定位到了基因,没有看这个位点的突变对这个基因具体的影响!但是有研究表明它们可能是somatic的突变,其实就有一点风险了。(这就是为什么大家做基因检测看到的报告,都是有什么风险,很狗血,因为连负责这个检测报告的生信工程师也没办法给出肯定答案啊!)
有点不开心,不想看下去了。
文:Jimmy
图文编辑:吃瓜群众